Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
井戸村 泰宏; 伊奈 拓也*; Obrejan, K.; 朝比 祐一*; 松岡 清吉*; 今村 俊幸*
no journal, ,
ポスト京重点課題において、メニーコアプロセッサに基づく次世代計算環境向けにジャイロ運動論的トロイダル5次元オイラーコードGT5Dの計算技術開発を進めてきた。本発表では、複雑なプロセッサ内メモリ階層、および、演算加速に比べて限定的なノード間通信性能に関する計算技術の課題を議論する。前者に関しては、各メニーコアアーキテクチャ上でステンシル計算カーネルのデータアクセスパターンを最適化し、高い性能向上を達成した。後者に関しては、先進的な省通信クリロフ部分空間法を適用した。この手法は集団通信を一桁以上削減し、さらに主要な計算カーネルの演算密度を向上する。上記の新たな計算技術の適用により、最新メニーコア環境におけるGT5Dの性能が大幅に向上し、Oakforest-PACS全系(8,192KNL)までの良好な強スケーリングを達成した。
井戸村 泰宏
no journal, ,
ジャイロ運動論的トロイダル5次元full-fオイラーコードGT5Dはスティフな線形4次元移流演算子に陰解法時間積分が適用する半陰解法差分スキームに基づいており、高速な運動論的電子の陰解法差分ソルバが全体の80%以上の計算コストを占める。この陰解法ソルバは元々クリロフ部分空間法を用いて開発されたが、大域的集団通信と袖通信が最新の演算加速環境におけるボトルネックとなってきた。この課題を解決するために、新しい半精度前処理を用いて収束特性を向上し、反復回数と通信回数を一桁削減した。富岳で新たにサポートされた半精度SIMD演算を活用して半精度前処理を用いた省通信ソルバを開発し、これをSummitにも移植した。新しい省通信ソルバによって富岳とSummitの両方で大幅な性能向上を達成し、開発手法の性能移植性を示した。